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摘要 : [目的 /意义 ] 构建 针对 我 国 地 方 政府 开放 数据 的 评估 框架 ,对 现 有 的 地 方 政府 开放 数据 平台 上 的 数 
据 层 面 进行 评价 并 提出 建议 ,以 助 推 地 方 政府 数据 开放 。[ 方 法 /过 程 ] 根据 政府 数据 开放 的 定义 、 原 则 与 标 
准 ,借鉴 国际 开放 数据 评估 框架 ,基于 目前 我 国政 府 数 据 开放 的 政策 要 求 和 发 展现 状 , 汇 聚 各 界 专家 学 者 的 意 
见 ,构建 起 一 个 系统 科学 、 多 维度 、 可 操作 的 政府 数据 开放 评估 框架 ,并 基于 该 框架 对 我 国 现 有 的 46 个 地 方 政 
府 开放 数据 平台 上 的 数据 进行 综合 评估 。 [结果 /结论 ] 研究 发 现 我 国 地 方 政府 开放 的 数据 在 数量 、 质 量 、 标 


准 、 履 盖 面 和 可 持续 性 方面 存在 的 各 类 问题 。 
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评估 框架 


政府 部 门 在 履行 行政 职责 过 程 中 制作 .获取 和 保存 
的 又 据 资源 是 整个 社会 的 公共 资源 ,在 保障 国家 秘密 、 
击溃 秘 密 和 个 人 隐私 的 前 提 下 ,将 政府 数据 最 大 限度 地 
参天 给 社会 进行 开发 利用 ,将 有 利于 提升 政府 透明 度 ， 
激 次 创新 创业 活力 ,转变 经 济 发 展 方式 ,提高 公共 服务 
水 叱 ,提升 政府 治理 能 力 " 。 近 年 来 , 随 着 开放 政府 数 
据 存 全 球 范围 内 的 迅速 推进 ,我 国政 府 高 度 重视 开 放 政 
府 胜 据 。2012 年 以 来 ,我 国 已 有 近 50 个 地 方 政 府 陆续 
推 氏 数据 开放 平台 ,取得 了 一 定 成 效 , 也 积累 了 不 少 经 
验 轩 然 而 ,我 国 地 方 政府 到 底 开 放 了 多 少数 据 ,这 些 数 
据 的 标准 和 质量 如 何 ,覆盖 了 那些 领域 ?是否 可 持续 开 
放 ? 还 存在 哪些 问题 和 挑战 , 亟 需 开展 深入 评测 和 研究 。 

本 文 首先 构建 起 一 个 系统 科学 .多 维度 .可 操作 的 
开放 数据 评估 框架 ,并 基于 该 框架 对 我 国 现 有 的 地 方 
政府 开放 数据 平台 上 的 数据 层面 进行 综合 评价 ,提出 
优化 和 提升 建议 ,希望 有 助 于 我 国 地 方 政府 数据 开放 
的 推进 与 发 展 。 


2 文献 综述 


2.1 关于 政府 数据 开放 的 基本 原则 和 标准 
2007 年 12 月 ,30 位 开放 数据 倡导 者 聚集 在 美国 


加 州 举行 会 议 ,共同 提 出 了 政府 数据 开放 的 8 项 基本 
原则 中 ;完整 的 一 手 的 .及 时 的 ,可 获取 的 、 可 机 读 的 、 
对 非 歧视 性 的 , 非 专属 的 、 免 授权 的 。 根 据 世 界 银行 的 
定义 ,开放 数据 是 指 “ 能 被 任何 人 出 于 任何 目的 不 受 限 
制 地 进行 自由 利用 、 再 利用 和 分 发 ,并 最 大 程度 保持 其 
原始 出 处 和 开放 性 的 数据 ”。 开 放 定 义 指出 开放 意味 
着 任何 人 都 可 以 出 于 任何 目的 自由 地 访问 、 使 用 、 修 改 
和 共享 数据 ” “开放 性 "应 具备 两 个 维度 的 特性 :一 
为 技术 性 开放 , 即 数据 应 为 可 机 读 , 非 专属 性 的 电子 格 
式 , 从 而 能 被 任何 人 使 用 和 通用 能 被 免费 的 软件 获取 
和 利用 ,数据 还 应 被 置 于 公共 服务 器 上 供 公 众 获 取 ,不 
设 密码 和 防火 墙 ;二 为 法 律 性 开放 , 即 这 些 数据 必须 被 
置 于 公共 领域 ,或 处 于 自由 利用 条 款 下 ,受到 最 低 程 度 
的 限制 ”。2010 年 ,万 维 网 的 发 明 人 ,语义 网 和 关联 
数据 的 创建 者 和 倡导 者 T. Berners -Lee 提出 了 一 个 开 
放 数 据 五 星 标准 ” :一 星 是 指 基 于 开放 授权 在 网 络 上 
开放 数据 ,用 户 可 以 查看 .搜索 .存储 和 修改 数据 ,还 可 
以 与 任何 人 分 享 这 些 数据 ,但 对 数据 格式 不 做 要 求 , 可 
能 采用 PDF JPESG 等 格式 ;二 星 是 指 以 可 机 读 、 结 构 化 
格式 开放 数据 ,例如 EXCEL 电子 表格 的 形式 ,但 不 包 
括 表 格 的 图 像 扫描 件 ; 三星 是 指 在 满足 二 星 标准 的 基 
础 上 ,以 非 专属 开放 格式 开放 数据 ,如 采用 CSV 格式 
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而 不 是 EXCEL 格式 ,用 户 不 需要 使 用 专属 的 、 付 费 的 
软件 就 可 以 分 析 数据 ;四 星 是 指 在 满足 以 上 要 求 的 基 
础 上 ,采用 W3C 开放 标准 的 数据 (如 RDF 和 SPARQL 
格式 ) ,为 每 一 个 数据 集 设置 固定 的 URL 链接 ,便于 
使 用 者 发 现 和 链接 到 数据 集 的 具体 位 置 ;五 星 是 指 
在 满足 以 上 要 求 的 基础 上 ,借助 W3C 标准 和 关联 数 
据 原则 ,使 数据 之 间 实 现 关联 ,提供 数据 的 背景 。 
2015 年 《开放 数据 完 章 》 将 开放 数据 界定 为 具备 必 
要 的 技术 和 法 律 特 性 ,从 而 能 被 任何 人 、 在 任何 时 间 
和 地 点 进行 自由 利用 、 再 利用 和 分 发 的 电子 数据 。 
该 完 章 还 提出 了 政府 数据 开放 应 遵循 的 六 大 原 
则 中 :默认 开放 、 及 时 和 全 面 . 可 获取 和 可 利用 ,可 比 
较 和 互 操作 性 ,致力 于 改善 治理 和 公民 参与 .致力 于 
包容 性 发 展 和 创新 。 

与 我 国 对 于 政府 数据 开放 的 政策 要 求 也 与 以 上 国际 
械 闪 相符 。2017 年 2 月 ,中 央 全 面 深化 改革 领导 小 组 
角 芒 通过 的 《关于 推进 公共 信息 资源 开放 的 若干 意 
内 /者 出 ,要 保证 开放 数据 的 “完整 性 、 准 确 性 \ 原 始 
性 器 可 读 性 、 非 歧视 性 、 及 时 性 ,方便 公众 在 线 检 
索 \ 荚 取 和 利用 ”"。2017 年 5 月 ,国务 院 办 公 厅 印发 的 
( 煞 沙 信息 系统 整合 共享 实施 方案 ) 指 出 ,要 向 社会 开 
放 政 府 部 门 和 公共 企 事业 单位 的 原始 性 .可 机 器 读 
取 : 可 供 社会 化 再 利用 的 数据 集 *。2018 年 1 月 ,中 央 
网 信 办 发展 改 革 委 以 及 工业 和 信息 化 部 联合 印发 的 
《和 :信息 资源 开放 试点 工作 方案 ) 要 求 试点 地 区 “ 提 
升 产 据 的 完整 性 准确 性 、 有 效 性 、 时 效 性 ” “明确 开 
放 数 据 的 完整 性 .机 器 可 读 性 .格式 通用 性 等 要 求 ”。 
国内 外 相关 机 构 和 专家 对 政府 数据 开放 标准 的 梳理 结 
果 如 表 1 所 示 : 

表 1 政府 数据 开放 的 标准 


一 


机 构 /文件 标准 
政府 数据 开放 8 项 基本 原 ”完整 的 一 手 的 .及 时 的 、 可 获取 的 、 可 机 读 
则 的 , 非 靶 视 性 的 , 非 专属 的 、, 免 授权 的 


世界 银行 “技术 性 开放 ”和 “法 律 性 开放 ” 
T. Bemers-Lee 的 “开放 数 ”开放 授权 、 可 机 读 、 结 构 化 \ 非 专属 性 、W3C 
据 五 星 标准 ” 开放 标准 、 关 联 数据 


2.2 ”关于 政府 数据 开放 评估 的 研究 

E，Oviedo 等 "建立 了 一 个 开放 数据 平台 质量 模 
型 ,包括 可 用 性 、 再 利用 的 能 力 、 关 联 性 可靠 性 、 颗 粒 
度 和 可 视 化 6 个 维度 。G.，Viseusi 等 "分别 就 完整 性 、 
准确 性 和 及 时 性 3 个 数据 质量 维度 ,提出 了 一 个 基于 
质量 的 开放 政府 数据 完成 度 评估 框架 。R. PP. 
Lourenco' ”提出 了 数据 质量 .平台 数据 主体 和 时 间 的 完 
整 性 .数据 获取 的 便捷 性 数据 的 可 用 性 和 可 理解 性 、 
及 时 性 ,数据 价值 和 有 用 性 、 颗 粒度 7 个 指标 。0. Bel- 
lo 等 '" 使 用 的 评估 变量 包括 “五 星 标准 ”、 实 施 技术 、 
数据 格式 、 开 放 许 可 、 关 键 数 据 集 和 功能 性 。 

2014 年 ,纽约 大 学 治理 实验 室 对 国际 上 具有 代表 
性 的 十 一 个 研究 机 构 .评估 指标 、 政 府 部 门 和 咨询 公司 
界定 的 “开放 数据 "定义 进行 梳理 后 发 现 , 被 提 及 最 多 
的 开放 数据 标准 包括 免费 .公开 提供 、 非 排他 性 、 可 利 
用 结构 、 开 放 授 权 和 可 再 利用 等 要 求 "" 1。 I Susha 
等 2 围绕 元 数据 .元 方法 .元 理论 3 个 维度 ,对 5 个 开 
放 政 府 数据 评估 项 目 进 行 了 比较 研究 。 

我 国学 者 也 对 政府 数据 开放 的 评估 方法 开展 了 
研究 。 夏 义 万 对 7 个 国际 组 织 开 放 政 府 数据 评估 项 目 
的 评估 主题 .评估 侧重 点 ,评估 对 象 和 评估 方法 进行 了 
比较 和 总 结 ” 。 郑 大 和 关 文 去 通过 对 11 个 具 代表 性 
的 国内 外 评估 项 目的 评估 框架 .指标 和 方法 进行 梳理 
分 析 后 发 现 ,目前 开放 政府 数据 评估 项 目的 指标 体系 
主要 包含 基础 .平台 数据 .使 用 和 效果 5 个 维度 ,而 重 
点 是 数据 和 基础 两 个 层面 '"。 郑 路 平和 刘 美 岭 对 世 
界 银 行 的 “开放 数据 准备 度 ” .万 维 网 基金 的 “开放 数 
据 晴 雨 表 ”、 开 放 知 识 基 金 的 “全 球 开放 数据 指数 ”经 
济 合作 与 发 展 组 织 的 “OURdata 指数 ”以 及 联合 国 的 
“开放 政府 数据 调查 ”等 国外 几 个 具有 代表 性 的 开放 
数据 评估 项 目 , 从 起 始 时 间 .评估 频率 .评估 对 象 .评估 
工具 .数据 获取 及 分 值 计算 等 多 个 维度 进行 了 对 比 , 归 
纳 出 这 些 评估 项 目的 共同 点 和 差异 之 处 ,探讨 了 已 有 
研究 存在 的 一 些 问题 和 不 足 ": 。 陈 美 利 用 文献 调研 
和 案例 分 析 的 研究 方法 分 析 了 美国 .英国 澳大利亚 主 
要 国家 以 及 国际 组 织 在 开放 政府 数据 价值 评估 的 具体 


Wg 


《开放 数据 完 章 》 默认 开放 、 及 时 和 全 面 `. 可 获取 和 可 利用 、 可 
比较 和 互 操作 性 
中 央 全 面 深化 改革 领导 小 ”完整 性 、 准 确 性 .原始 性 ` 机 器 可 读 性 、 非 歧 
组 (关于 推进 公共 信息 资 ” 视 性 .及 时 性 ,方便 公众 在 线 检索 、 获 取 和 利 
源 开放 的 若干 意见 》 用 

中 央 网 信 办 发 展 改革 委 以 ”完整 性 ,准确 性 有 效 性 、 时 效 性 、 机 器 可 读 
及 工业 和 信息 化 部 联合 印 ” 性、 格式 通用 性 

发 的 《公共 信息 资源 开放 

试点 工作 方案 》 


实践 ,提出 了 认识 开放 政府 数据 价值 评估 的 困境 、 重 视 
并 开展 开放 政府 数据 的 价值 评估 ,注重 开放 政府 数据 
价值 评估 方法 等 建议 。 韦 忻 伶 . 安 小 米 等 对 现 有 的 
开放 政府 数据 评估 体系 进行 系统 梳理 ,归纳 了 现 有 评 
人 体系 的 评估 动因 、 评 估 内 容 、 评 人 方法 和 相应 特点 及 
适用 性 ,发 现 现 有 评估 体系 在 城市 层面 特定 行业 和 开 
放 数 据 成 熟 度 评估 方面 存在 局 限 ,并 构建 了 开放 政府 
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数据 评估 动因 .评估 内 容 和 评估 方法 的 循环 迭代 检验 
机 制 ]。 

还 有 一 些 学 者 对 我 们 的 政府 数据 开放 的 现状 进行 
了 实际 评估 。 郑 磊 和 高 丰 首 次 通过 基础 层 .数据 层 . 平 
台 层 3 个 层面 的 13 个 维度 对 我 国 8 个 地 方 政府 的 开 
放 数 据 实践 进行 了 评估 '"” 。 郑 舌 和 能 和 久 阳 又 进一步 
对 我 国 13 个 地 方 政府 数据 开放 平台 上 数据 的 技术 和 
法 律 特性 进行 了 研究 ,覆盖 开放 数据 的 数量 、 种 类 , 格 
式 获取 广 式 .及 时 性 .开放 授权 ,元 数据 ,浏览 时 和 下 
载 量 等 维度 ?1 。 夏 义 曹 梳理 了 国际 上 具有 代表 性 的 
政府 数据 开放 评估 体系 内 容 , 系统 分 析 了 不 同 评估 体 
系 对 中 国政 府 数据 开放 情况 的 基本 认 知 。 发 现 我 国 在 
政府 数据 开放 水 平 .信息 法 律 制度 .组织 管理 体系 以 及 
技术 架构 等 人 定 的 差距 与 不 足 ”。 赵 继 
娣 莉 张 罕 仑 以 上 海 市 政府 数据 开放 为 例 ,结合 内 容 分 
析 双 据 和 访谈 资料 ,从 开放 数据 的 提供 与 管理 .公民 的 
参合 和 数据 利用 情况 3 个 维度 入 手 ,对 地 方 政府 数据 
天 组 成 效 进行 了 评价 ,剖析 了 地 方 政府 数据 开放 的 现 
状 加 。 沈 唱 等 基于 政府 数据 开放 平台 跨 时 间 纵向 发 
惨 袍 角 ， 从 开放 程度 提升 度 、 更 新 频率 兑现 提升 度 .用 
虐 竹 用 提升 度 3 个 维度 建立 政府 数据 开放 发 展 速度 评 
依 生 系 , 并 选取 5 个 省 级 政府 数据 开放 平台 和 取 数据 ， 
德 刘 政 府 数据 开放 发 展 速度 指数 ,同时 结合 中 国 开放 
数 车 指 数 ,分 析 了 政府 数据 开放 发 展 态势 。 海 伦 和 
7 网 用 对 我 国 13 个 城市 政府 数据 开放 平台 的 总 体 效率 、 
纯 宦 术 效 率 和 规模 效率 进行 评估 。 结果 显示 ,在 评估 
的 号 个 城市 政府 的 数据 开放 网 站 中 有 9 个 网 站 纯 技 
术 且 行 效率 相对 有 效 握 。 
2.3 研究 现状 评述 

从 以 上 综述 可 见 ,国内 外 学 者 对 于 开放 数据 评估 
方法 的 研究 已 有 一 定 积累 ,针对 我 国政 府 开放 数据 开 
展 的 评估 也 已 起 步 。 然 而 ,目前 国际 上 关于 开放 政府 
数据 的 评估 主要 集中 于 国家 层面 ,而 我 国学 者 已 开展 
的 针对 我 们 地 方 政府 数据 开放 平台 的 评估 在 样本 覆盖 
上 还 不 不 够 全 面 ,在 评估 框架 上 也 不 够 聚焦 。 虽 然 对 
数据 .平台 .政策 .管理 等 层面 都 有 所 涉及 ,但 专门 针对 
数据 这 一 核心 层面 开展 的 评估 指标 还 不 够 深入 和 系 
统 。 随 着 我 国 地 方 政府 数据 开放 实践 的 不 断 推进 , 越 
来 越 多 的 地 方 政府 推出 了 数据 开放 平台 ,地 方 政府 数 
据 开 放 的 内 容 和 形式 更 趋 多 样 , 吉 需 针对 更 大 范围 的 
样本 ,更 系统 和 更 聚焦 地 专门 针对 数据 层 开展 研究 ,以 
全 面 呈现 和 深入 分 析 我 国 地 方 政府 开放 数据 的 现状 与 


问题 。 
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总 体 上 ,本 研究 依照 政府 数据 开放 的 原则 与 标准 ， 
参考 了 国际 开放 数据 评估 框架 和 指标 体系 ,又 结合 
目前 我 国政 府 对 于 数据 开放 的 政策 要 求 和 各 地 发 展现 
状 , 吸 纳 了 各 界 专 家 学 者 提出 的 建议 意见 ,最 终 确定 了 
研究 的 评估 对 象 .指标 体系 和 数据 采集 和 分 析 方 法 。 
3.1 评估 框架 

本 人 研究 重点 针对 各 地 数据 开放 平台 上 的 数据 层面 
进行 评估 。 研 究 的 观察 对 象 为 地 方 政 府 数据 开放 平台 
上 可 通过 直接 下 载 或 API 接口 两 种 方式 公开 获取 的 、 
电子 形式 的 原始 数据 集 及 相关 信息 ,不 包括 未 通过 公 
开平 台 开 放 , 而 是 通过 内 部 授权 、 协 议 开放 等 形式 向 社 
会 提供 的 政府 数据 。 

本 研究 邀请 了 国内 近 40 位 数据 领域 的 专家 与 学 者 
共同 参与 构建 评估 框架 。 这 些 专家 和 学 者 具有 公共 管 
理 、 信 息 科 学 .计算 机 科学 政治 学 等 不 同 的 学 科 背 景 
来 自 于 高 校 , 科 研 机 构 .政府 和 企业 ,可 以 反映 跨 界 、 多 
学 科 第 三 方 .中 立 的 专业 视角 和 实际 需求 。 首 先 ,专家 
学 者 们 根据 系统 .科学 可 操作 的 原则 ,通过 分 组 讨论 提 
出 需要 评估 的 各 项 指标 ;然后 ,再 通过 全 场 讨 论 对 各 组 
提出 的 指标 进行 梳理 归 类 ,合并 同类 项 ;之 后 ,全 场 通过 
现场 投票 选 出 相对 重要 的 指标 。 由 此 ,初步 构建 起 一 个 
针对 中 国 地 方 政府 数据 开放 数据 层面 的 评估 指标 体系 ， 
包括 数据 质量 ,数据 标准 ,数据 可 持续 性 ,数据 数量 和 数据 
覆盖 面 等 一 级 指标 和 相应 的 二 级 \ 三 级 指标 如 表 2 所 示 : 

表 2 政府 数据 开放 数据 层 评估 框架 


一 级 指标 二 级 指标 三 级 指标 
后 / 
数据 质量 优质 数据 / 
无 低 质 数据 无 低 容量 数据 
无 碎片 化 数据 
无 问题 数据 无 重复 创建 
无 生硬 格式 转化 
无 无 效 数据 
数据 标准 开放 授权 / 
技术 性 开放 可 机 读 格 式 
放 格 式 
RDF 格式 
API 接口 
元 数据 完整 性 基本 元 数据 覆盖 率 
API 描述 规范 
数据 覆盖 面 主题 覆盖 / 
部 门 覆 盖 / 
高 需求 关键 词 覆盖 / 
数据 可 持续 性 持续 增长 / 
动态 更 新 * 
历史 存档 / 
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之 后 ,专家 学 者 们 再 通过 在 线 调查 工具 匿名 对 指 
标的 相对 重要 性 进行 排序 ,即将 其 认为 最 重要 的 指标 
排序 为 1, 其 次 为 2, 依 次 类 推 。 排 序 结 果 如 表 3 所 示 ， 
被 排 在 最 重要 位 置 的 指标 是 “数据 质量 ”, 这 反映 了 各 
界 对 高 质量 数据 集 的 需求 。 被 排 在 第 2 -第 5 位 的 指 
标 依次 是 数据 标准 数据 可 持续 性 数据 数量 和 数据 尾 


盖 面 。 
表 3 专家 学 者 评估 指标 相对 重要 性 排序 结果 
指标 名 称 排序 得 分 相对 重要 性 
数据 质量 1.40 1 
数据 标准 2.80 2 
数据 可 持续 性 2.97 3 
数据 数量 3.73 4 
数据 覆盖 面 3.87 5 


一 
3.22 评估 对 象 

马术 研究 根据 公开 报道 ， 以 及 使 用 “数据 + 开放” 
“ 台 据 + 公开 ”公共 + 数据 “政务 + 数据 “政府 + 
嫩 提 “地 名 + 数据 “地 名 + 政府 数据 “地 名 + 开放 
数据 "等 关键 词 进 行 搜索 ,发 现 截 至 2018 年 4 月 中 旬 


J 地 政府 数据 开放 平台 纳入 评估 范围 : 
号 (1) 平台 域名 中 出 现 gov. en ,作为 确定 其 为 政府 官 
CN 


方 认 可 的 数据 开放 平台 的 依据 。 

(2) 平 台 形 式 为 “统一 专 有 式 " 或 “统一 通信 式 ”。 
“统一 专 有 式 " 是 指 开 放 数 据 统 一 汇聚 在 一 个 专门 的 
平台 上 进行 开放 入 统一 艇 入 式 " 是 指 开放 数据 统一 汇 
聚 为 一 个 栏目 版 块 , 徐 入 在 政府 门户 网 站 或 政务 服务 
网 站 上 。 

(3) 平 台所 代表 的 地 方 政 府 的 行政 级 别 为 地 级 市 
以 上 。 

(4) 平 台 上 确实 开放 了 电子 格式 的 .可 通过 下 载 
或 接口 形式 获取 的 结构 化 的 数据 集 。 有 些 名 为 “数据 
开放 ”的 平台 实质 上 只 提供 了 非 结 构 化 的 文本 内 容 或 
跳 转 到 其 他 相关 网 页 的 链接 ,不 存在 可 通过 下 载 或 接 
口 形式 获取 的 、 结 构 化 的 数据 集 。 这 类 平台 更 多 属于 
传统 的 “信息 公开 ”门户 ,因而 未 被 纳入 本 次 评估 范 
围 ,如 新 疆 维吾尔 自治 区 政务 数据 开放 网 、 四 川 省 人 民 
政府 网 站 上 的 “开放 数据 "模块 和 广东 清远 市 人 民政 
府 网 的 “数据 开放 ”频道 等 。 

基于 以 上 选择 标准 ,被 纳入 本 研究 评估 的 地 方 政 
府 数 据 开放 平台 共 46 个 ,这 些 平台 符合 政府 数据 开放 
的 基本 特征 ,是 我 国政 府 数据 开放 的 先行 者 。 具 体 平 
台 名 称 所属 地方 政府 和 平台 域名 如 表 4 所 示 : 


N 表 4 ”评估 范围 ( 按 行政 层级 及 拼音 首 字母 排序 ) 
序号 平台 名 称 地 点 层级 平台 域名 
re 
> 4 北京 市 政务 数据 资源 网 北京 市 省 级 http://www. bjdata. gov. cn 
[qe 开放 广东 广东 省 省 级 http://www. gddata. gov. cn 
SG 贵州 省 政府 数据 开放 平台 贵州 省 省 级 A 
全 江西 省 政府 数据 开放 网 站 江西 省 省 级 和 
OO 放 宁 夏 宁夏 回族 自治 区 省 级 http://ningxiadata. gov. cn 
6 山东 公共 数据 开放 网 山东 省 省 级 http ://data. sd. gov. cn 
7 上 海 政 府 数 据 服务 网 上 海 市 省 级 http://www. datashanghai. gov. cn 
浙江 政务 服务 网 浙江 省 省 级 http://data. zjzwfw. gov. cn 
9 广州 市 政府 数据 统一 开放 平台 广东 省 广州 市 副 省 级 http://www. datagz. gov. cn 
10 深圳 市 政府 数据 开放 平台 广东 省 深圳 市 副 省 级 http://opendata. sz. gov. cn 
11 哈尔滨 市 数据 开放 黑龙 江 省 哈尔滨 市 副 省 级 http://data. harbin. gov. en 
12 武汉 政府 公开 数据 服务 网 湖北 省 武汉 市 副 省 级 http ://www. wuhandata. gov. cn 
13 济南 市 公共 数据 开放 网 山东 省 济南 市 副 省 级 http://www. jndata. gov. cn 
14 青岛 市 政府 数据 开放 网 山东 省 青岛 市 副 省 级 http ://data. qingdao. gov. cn 
15 宁波 市 政府 数据 服务 网 浙江 省 宁波 市 副 省 级 http://www. datanb. gov. cn 
16 数据 东莞 广东 省 东莞 市 市 级 http://dataopen. dg. gov. cn 
17 佛山 政府 数据 开放 平台 广东 省 佛山 市 市 级 http://www. fsdata. gov. cn 
18 开放 惠州 广东 省 惠州 市 市 级 http://data. huizhou. gov. en 
19 开放 江门 广东 省 江门 市 市 级 http://opendata. jiangmen. gov. cn 
20 梅州 市 人 民政 府 数 据 开 放 平 台 广东 省 梅州 市 市 级 https://www. meizhou. gov. cn/opendata 
21 中 国 阳江 数据 开放 广东 省 阳江 市 市 级 http://www. yangjiang. gov. cn/ sijkf 
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( 续 表 4) 
序号 平台 名 称 地 点 层级 平台 域名 

22 湛江 数据 服务 网 广东 省 湛江 市 市 级 http://data. zhanjiang. gov. cn 

23 後 庆 数 据 开放 广东 省 後 庆 市 市 级 http://www. zhaoqing. gov. cn/ sjkf 

24 放 中 山 广东 省 中 山 市 市 级 http://zsdata. zs. gov. cn/ web/index 

25 贵阳 市 政府 数据 开放 平台 贵州 省 贵阳 市 市 级 http://www. gyopendata. gov. cn 

26 荆门 市 人 民政 府 数 据 开 放 模 块 湖北 省 荆门 市 市 级 http://data. jingmen. gov. cn/app 

27 长 沙 数据 开放 湖南 省 长 沙市 市 级 http://data. changsha. gov. cn 

28 苏州 市 政府 数据 开放 平台 江苏 省 苏州 市 级 http://www. suzhou. gov. cn/ dataOpenWeb 

29 无 锡 市 政府 数据 服务 网 江苏 省 无 锡 市 市 级 http ://ete. wuxi. gov. cn/opendata 

30 扬州 市 政务 数据 服务 网 江苏 省 扬州 市 市 级 http://data. yangzhou. gov. cn 

31 乌 海 市 数据 开放 平台 内 蒙古 自治 区 乌 海 市 市 级 http://whdata. wuhai. gov. cn/odweb 

32 滨州 市 公共 数据 开放 网 山东 省 滨州 市 市 级 http://bzdata. sd. gov. cn 

33 德州 市 公共 数据 开放 网 东 省 德 ) 市 级 http://dzdata. sd. gov. cn 

34 东营 市 公共 数据 开放 网 山东 省 东营 市 市 级 http://dydata. sd. gov. cn 
T3 菏泽 市 公共 数据 开放 网 东 省 菏泽 市 市 级 http://hzdata. sd. gov. cn 
局 济宁 市 公共 数据 开放 网 东 省 济宁 市 市 级 http://jindata. sd. gov. en 
[| 莱芜 市 公共 数据 开放 网 东 省 莱芜 市 市 级 http://lwdata. sd. gov. cn 
LG 聊城 市 公共 数据 开放 网 东 省 聊城 市 市 级 http://ledata. sd. gov. en 
(ee) 临沂 市 公共 数据 开放 网 山东 省 临沂 市 市 级 hips 2 /yd sd gov. en 
Gn 日 照 市 公共 数据 开放 网 东 省 日 照 市 市 级 http://rzdata. sd. gov. cn 
C9 泰安 市 公共 数据 开放 网 东 省 泰安 市 市 级 http://tadata. sd. gov. cn 
3 威海 市 公共 数据 开放 网 山东 省 威海 市 市 级 http ://whdata. sd. gov. cn 
C4 潍坊 市 公共 数据 开放 网 山东 省 潍坊 市 市 级 http://wifdata. sd. gov. cn 
(er 烟台 市 公共 数据 开放 网 东 省 烟台 市 市 级 http://ytdata. sd. gov. cn 
QO 枣庄 市 公共 数据 开放 网 东 省 枣庄 市 市 级 http://zzdata. sd. gov. cn 

2 淄博 市 公共 数据 开放 网 东 省 淄博 市 市 级 http://zbdata. sd. gov. en 


3PK 数据 采集 及 分 析 
本 人 研究 采用 网 络 自动 抓 取 和 人 工 观察 相 结合 的 方 
法 采集 数据 。 以 2018 年 4 月 13 日 -2018 年 4 月 18 


a 


量 数 据 集 (多 为 一 个 数据 集 分 拆 出 的 单行 数据 ,或 未 整 
合成 一 个 数据 集 的 单行 数据 ) ,这 类 数据 的 再 利用 价值 
很 低 , 不 能 视 作 有 效 数据 集 ;(3) 数 据 集 名 称 下 提供 的 是 


日 区 数据 采集 周期 。 主 体 评估 分 析 部 分 基于 截至 
2018 年 4 月 18 日 从 各 地 平台 上 所 采集 的 数据 ,而 在 对 
“动态 更 新 "这 一 指标 的 评测 中 则 使 用 了 2018 年 1 月 
1 日 至 2018 年 4 月 18 日 这 一 时 间 段 内 所 采集 的 数据 。 
本 研究 对 采集 到 的 各 项 指标 的 数据 主要 使 用 描述 性 统 
计 分 析 交叉 分 析 ,文本 分 析 等 方法 进行 分 析 。 


4 研究 发 现 


4.1 数据 数量 


4.1.1 数据 集 总 量 数据 集 是 由 数据 组 成 的 集合 , 通 
常 以 表格 形式 出 现 ,每 一 “ 列 " 代 表 一 个 特定 变量 ,每 
一 “ 行 " 则 对 应 一 个 样本 单位 。 政 府 数据 开放 平台 往 
往 以 下 载 或 API 接口 的 形式 开放 数据 集 。 个 别 平台 在 
本 研究 中 未 被 视 作 有 效 的 开放 数据 集 , 主 要 有 以 下 3 
类 情况 :中 数据 集 名 称 下 不 存在 可 直接 下 载 或 通过 接 
口 获取 的 数据 集 ;@ 数 据 集中 仅 有 0 - 2 行 数据 的 低 容 
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网 页 链接 ,是 链 接 跳 转 后 出 现 无 法 通过 下 载 或 接口 形式 
获取 的 文本 内 容 。 开 放 的 有 效 数据 集 总 量 ( 含 直接 下 载 
和 API 接口 开放 ) 最 高 的 10 个 地 方 平台 如 图 1 所 示 : 


数量 集 总 量 (个 ) 


2219 
1422 
1122 
1050 
896 
| | | 中 ni 
贵阳 ”上海 青岛 武汉 济南 哈尔滨 深圳 北京 ”无 锡 东莞 


地 点 


图 1 各 地 平台 上 的 数据 集 总 量 (前 10 名 ) 


4.1.2 数据 容量 数据 容量 是 指 在 各 地 平台 可 下 载 、 
结构 化 的 数据 集中 ,将 字段 数 ( 列 数 ) 乘 以 条 数 ( 行 数 ) 
得 出 的 数据 总 量 , 用 以 衡量 平台 上 提供 的 数据 集 的 实 
际 数据 量 大 小 。 数 据 容 量 排名 前 10 的 地 方 平台 见 图 
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2。 各 地 平台 间 数 据 容量 的 差距 较为 明显 ,排名 前 3 的 ”” 据 集 按照 数据 容量 进行 排序 , 共 发 现 了 146 个 优质 数 
数据 容量 均 超过 8 000 万 ,但 仍 有 超过 三 分 之 一 的 平 。” 据 集 ,其 分 布 状况 见 图 3。 在 46 个 政府 数据 开放 平台 
台 开 放 的 数据 容量 在 10 万 以 下 。 中 ,17 个 平台 有 优质 数据 集 入 选 ,其 他 地 方 平台 没有 
数据 容量 ( 万 个 ) 发 现 优质 数据 集 。 表 5 是 排名 前 10 位 的 优质 数据 集 
A 名 称 与 其 所 属 平台 ,这 些 数 据 集 普遍 具有 较 高 的 条 数 、 
字段 数 和 下 载 量 等 ,内 容 上 主要 和 商事 主体 .药品 等 相 
5086 5014 关 。 
| 下 i 优质 数据 集 米 旦 (个) 
国 809 
广州 ”佛山 贵阳 ”上 海 i UD 青岛 ”东莞 惠州 


2 各 地 平台 上 的 开放 数据 容量 (前 10 名 ) 


4.2 类 量 
下- 数据 质量 


贵阳 贵州 哈尔滨 上 海 广东 广州 宁波 青岛 惠州 佛山 长 沙 北京 荆门 浙江 


E12 
国 国 2 。 
Mi ee a 
i 
东莞 乌 海 江门 
地 点 


4.231 优质 数据 优质 数据 指 的 是 数据 量 大 ,社会 需 
王 训 的 数据 集 。 本 研究 对 各 地 平台 上 所 有 可 下 载 的 数 图 3 各 地 平台 的 优质 数据 集 数量 
LO 
©O 0 
© 表 5 前 10 位 优质 数据 集 
[ee 总 数据 集 名 称 所 属地 方 平台 数据 容量 (个 ) 条 数 (条 ) 字段 数 (个 ) 下 载 量 (次 ) 
OO 工商 登记 信息 东莞 46 416 553 2 018 111 23 10 063 
CD 商事 主体 个 体 年 报 基本 信息 广州 34 100 000 1705 000 20 524 
= 商事 主体 基础 信息 佛山 8 259 768 458 876 18 365 
CN 自然 人 信息 佛山 6 554 376 1 638 594 4 168 
5 黑龙 江 省 统一 药品 信息 哈尔滨 6 106 135 174 461 35 177 
.之 工程 -投标 人 名 单 贵州 4 466 102 235 058 19 a 
DC 哈尔滨 市 个 体 基 本 信息 哈尔滨 4 353 930 483 770 9 281 
三 贵阳 市 城镇 居民 医疗 保险 药品 目录 贵阳 4 294 512 238 584 18 841 
mm 惠州 市 工商 开业 登记 信息 惠州 3 359 715 223 981 15 80 
-oo 哈尔滨 市 商事 主体 个 体 年 报 基本 信息 哈尔滨 3 274 398 545 733 6 2 757 
人 ”一 
4.2.2 无 低 质数 据 (2) 无 生硬 格式 转化 。 生 硬 格式 转化 是 指 平台 将 
(1) 无 低 容量 数据 。 低 容量 数据 是 指 条 数 在 两 行 非 结 构 化 的 DOC PDF 等 文件 中 的 数据 通过 生硬 方式 


或 两 行 以 内 的 数据 集 , 其 原因 可 能 是 数据 量 本 里 稀 少 
或 是 数据 经 统计 归 总 后 颗粒 度 过 大 ,此 类 数据 的 再 利 
用 价值 较 低 。 在 46 个 开放 数据 平台 中 , 近 三 分 之 二 的 
平台 上 存在 低 容量 数据 。 

(2) 无 碎片 化 数据 。 碎 片 化 数据 是 指 按照 时 间 、 
行政 区 划 、 政 府 部 门 等 被 人 为 分 割 的 数据 集 , 这 些 数 据 
集 进行 整合 后 将 更 有 利于 社会 的 开发 利用 。 目 前 大 部 
分 的 地 方 开放 数据 平台 均 存 在 碎片 化 数据 。 


4.2.3 无 问题 数据 
(1 ) 无 重复 创建 。 重 复 创建 是 指 平台 上 重复 出 现 


标题 相同 、 可 下 载 数 据 文件 相同 、 且 所 属 主题 相同 的 数 
据 集 。 在 46 个 开放 数据 平台 中 , 约 三 分 之 一 的 平台 存 
在 重复 创建 问题 。 


转化 成 XLS .CSV 等 机 读 格 式 ,而 数据 实质 上 仍 是 非 结 
构 化 的 情况 。 例 如 ,将 WORD 文件 中 大 段 的 文字 贴 到 
XLS 文件 中 ,将 DOC 格式 直接 转换 成 XLS 格式 等 。 本 
研究 发 现 有 8 个 地 方 平台 存在 上 述 问 题 。 

(3 ) 无 无 效 数 据 。 无 效 数据 是 指 以 下 3 类 情况 : 
数据 集 名 称 下 没有 数据 可 供 获取 ;@ 只 提供 数据 链 
接 ,无 法 获取 数据 集 ;@ 数 据 集 下 载 打 开 后 ,里 面 实际 
上 并 不 提供 数据 。 在 46 个 政府 数据 开放 平台 中 ,超过 
4.3 数据 标准 
4.3.1 开放 授权 开放 数据 应 通过 数据 开放 授权 协 
议 从 法 律 上 保障 数据 的 开放 性 。 目 前 ,各 地 平台 上 的 
数据 开放 授权 通常 包含 在 网 站 声明 .免责 条 款 或 服务 
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协议 中 。 本 研究 发 现 ,在 46 个 政府 数据 开放 平台 中 ， 
共有 33 个 平台 配 有 数据 开放 授权 协议 。 开 放 授权 协 
议 的 内 容 应 明确 授予 用 户 免费 获取 .不 受 歧 视 、 自 由 利 
用 、 自 由 传播 与 分 享 开放 数据 的 权利 。 目 前 仅 有 5 个 
地 方 平 台 的 授权 协议 全 部 明确 授予 了 上 述 4 项 权利 ， 
分 别 为 北京 上海. 贵州 广州 和 贵阳 ;大 部 分 地 区 满足 
了 免费 获取 和 不 受 歧视 两 项 ,而 其 余地 区 在 4 项 指标 
上 未 明确 提 及 ,或 语 下 不 详 。 

(1) 免 费 获取 。 免 费 获取 是 指 平台 在 开放 授权 中 
明确 授予 用 户 免费 获取 和 利用 开放 数据 的 权利 。 政 府 
数据 作为 公共 资源 ,原则 上 应 免费 向 社会 开放 ,除非 需 
要 对 数据 进行 额外 的 增值 加 工 和 针对 少数 用 户 的 个 性 
化 加 工 等 。 目 前 ,各 地 平台 上 的 相应 条 款 分 为 “免费 且 
人 和 * 现 阶段 免费 "两 类 。 其 中 ,只 有 贵州 贵 

: 莞 等 地 的 条 款 中 明确 指出 数据 免费 且 未 设 时限 ， 
ee 
沽 名 其 他 大 部 分 地 方 平台 则 在 服务 协议 中 提 到 * 现 阶 
腾 列 费 " ,但 设置 有 模糊 的 期 限 或 限制 ,如 “保留 收费 
权利 ”等 表述 。 
〇 (2) 非 歧视 性 。 开 放 授 权 是 指 平台 明确 授予 任何 

平等 访问 ,获取 ,使 用 和 分 享 开放 数据 的 权利 。 目 
前 如 地 平台 上 的 相应 条 款 均 明确 保障 了 数据 开放 的 非 
眶 视 性 ,对 任何 用 户 都 予以 平等 的 数据 获取 和 利用 权 
限 过 0 用户 享有 数据 资源 的 非 排他 使 用 权 "“ 不 受 获 
裤 侮 表述 。 

己 (3) 自 由利 用。 开放 授权 应 明确 授予 用 户 不 受 限 

制 节 对 “开放 数据 "进行 商业 和 非 商业 性 利用 的 权利 。 
目前 各 地 平台 上 相应 条 款 分 为 “明确 允许 自由 利用 
和 “未 提 及 可 自由 利用 ”两 类 。 其 中 ,只 有 北京 .广州 、 
贵阳 .贵州 .上海 等 地 明确 表示 用 户 可 “不 受 限 制 地 进 
行商 业 和 非 商业 性 利用 ”““ 享 有 增值 利用 的 权利 ”或 
“可 自由 利用 ” ,其 余地 方 的 条 款 中 均 未 对 用 户 利用 数 
据 的 权利 做 出 明确 说 明 。 

(4) 自由 传播 与 分 享 。 开 放 授权 应 明确 授予 用 户 
可 自由 传播 和 分 享 开 放 数据 的 权利 。 目 前 各 地 平台 上 
的 相应 条 款 分 为 “可 自由 传播 “未 提 及 可 自由 传播 " 
“自由 传播 受 限 "3 类 。 北 京 广州 .贵阳 、 贵 州 、 上 海 等 
地 授予 用 户 享有 免费 传播 现 有 开放 数据 的 权利 。 
4.3.2 技术 性 开放 本 人 研究 基于 T,， Berners -Lee 提出 
的 开放 数据 五 星 标准 和 其 他 有 关 开 放 数据 格式 的 标 
准 , 对 各 地 政府 数据 开放 平台 上 的 数据 集 的 格式 标准 
进行 评估 。 

(1) 可 机 读 格式 。 为 方便 用 户 获取 和 利用 数据 ， 
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数据 集 应 以 可 机 读 格式 开放 ,如 XLS、CSV JSON XML 
等 格式 。 图 4 展示 了 各 地 平台 上 可 下 载 数 据 集 总 量 

可 机 读数 据 集 总 量 对 比 的 前 10 名 。 总 体 上 ,已 有 38 
个 平台 开放 的 数据 集 基本 满足 了 可 机 读 格式 的 要 求 ， 
但 也 有 个 别 地 方 平 台 上 出 现 的 数据 集 为 DOC、PDF、 
JPG 等 不 可 机 读 格式 。 


实名 1 


1129 


贵阳 青岛 上海 ”济南 哈尔滨 | 


| 536 823 
无 锡 广州 武汉 ”北京 


可 下 载 数据 集 总 量 (个 ) 旧 可 机 读 格式 数量 (个 ) 


4 各 地 平台 可 下 载 数据 集 与 可 机 读 
格式 数据 集 数 量 (前 10 名 ) 


《2) 开 放 格 式 。 开 放 格 式 是 指 可 下 载 数据 集 应 以 
开放 的 非 专 属 的 格式 提供 ,任何 实体 不 得 在 格式 上 排 
除 他 人 使 用 数据 的 权利 ,以 确保 数据 无 需 通过 某 个 特 
定 (特别 是 收费 的 ) 软件 或 应 用 程序 才能 访问 。 例 如 
CSV 是 开放 格式 ,而 XLS 则 不 是 。 图 5 是 各 地 方 平台 
上 可 下 载 数据 集 总 量 与 开放 格式 总 量 对 比 的 前 10 名 。 
目前 ,有 24 个 地 方 平台 上 提供 的 数据 集 全 部 满足 开放 
格式 的 标准 ,其 他 平台 则 没有 提供 任何 开放 格式 的 数 
据 集 。 


2211 


广州 ”北京 ”山东 威海 
地 点 


可 下 载 数 据 集 总 量 (个 ) 日 开 放 格 式 数量 (个) 


5 各 地 平台 可 下 载 数据 集 与 开放 
格式 数据 集 数 量 (前 10 名 ) 


(3)RDF 格式 。 本 研究 还 对 RDF 格式 进行 了 评 
估 , 即 开放 数据 五 星 标准 中 达到 的 四 星 要求 。 目 前 ,我 
司仪 有 贵阳 提供 了 符合 RDF 格式 的 数据 集 , 共 有 216 
个 RDF 格式 的 数据 集 。 

(4)API 接口 比例 。 除 了 通 


过 直接 下 载 方式 提供 
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数据 外 ,还 可 通过 接口 方式 使 用 户 实时 高 效 地 获取 数 
据 , 满 足 其 开发 应 用 程序 的 需求 ,尤其 适合 用 于 开放 实 
时 性 强 、 规 模 大 的 数据 。 目 前 ,我 国有 16 个 地 方 平台 
为 每 个 数据 集 提供 了 接口 ,但 仍 有 近 三 分 之 一 的 平台 
没有 提供 或 仅 提供 了 少量 的 API 接口 。 
4.3.3 元 数据 完整 性 ”提供 元 数据 有 助 于 数据 利用 
者 清楚 地 了 解数 据 集 的 内 容 与 背景 ,从 而 更 好 地 获取 
和 利用 数据 。 
(1) 基本 元 数据 覆盖 率 。 综 合 梳理 我 国 《政务 信 
息 资 源 编目 编制 指南 (试行 )》 中 关于 核心 元 数据 的 定 
义 描 述 、 国 际 开 放 数 据 平 台 上 提供 的 基本 元 数据 条 目 
以 及 目前 我 国 半数 以 上 的 平台 已 实际 提供 的 元 数据 条 
目 ,本 研究 确定 了 以 下 12 个 条 目 作为 开放 数据 集 基本 
的 元 数据 条 目 ,包括 数据 名 称 .摘要 简介 .标签 关 键 字 、 
主题 数据 格式 、 开 放 属 性 ,提供 单位 ,发布 日 期 、 
日 期 .更 新 频率 .数据 指标 .数据 量 。 
LO 图 6 反映 出 以 上 12 个 基本 元 数据 条 目 在 46 个 地 
台 的 分 布 情况 。 目 前 ,46 个 地 方 平 台 全 部 都 已 提 
供 汪 数据 集 名 称 ,大 多 数 平台 提供 了 摘要 简介 .数据 提 
供认 位 ,发布 日 期 数据 主题 数据 格式 等 ,而 能 提供 更 
0 


20 
3 
时 
> 


chinaXiv 


6 ”基本 元 数据 条 目 在 各 地 平台 的 分 布 数 


(2) API 描述 规范 。API 描述 有 助 于 数据 利用 者 
清楚 地 了 解 API 的 具体 信息 及 获取 方式 ,从 而 更 好 地 
调用 接口 并 获取 数据 。 本 研究 从 数据 资源 描述 和 数据 
调用 说 明 两 方面 评估 API 描述 情况 。 资 源 描述 是 指 


信息 。 在 提供 API 接口 的 36 个 地 方 平 台中 ,33 个 地 方 
平台 均 提 供 了 资源 描述 和 数据 调用 说 明 。 

4.4 ”数据 覆盖 面 

4.4.1 主题 覆盖 率 ”提高 数据 开放 的 广度 和 和 腹 盖 率 
有 利于 数据 利用 者 对 来 自 多 种 领域 的 数据 进行 融合 利 
用 。 本 研究 将 开放 数据 主题 归纳 为 经 贸 工商 \ 交 通 出 
行 ,机构 团体 、 文 化 休闲 .卫生 健康 、 教 育 科 技 、 社 会 民 
生 、 资 源 环境 城建 住房 .公共 安全 农业 农村 、 社 保 就 
业 、 财 税金 融 \ 信 用 服务 共 14 个 大 类 。 图 7 体现 了 各 
地 平台 在 14 个 主题 下 所 开放 的 数据 集 数 量 。 其 中 , 社 
会 民生 ,经贸 工 商 教育 科技 等 主题 的 数据 集 开 放 数 量 
最 多 。 在 14 个 主题 领域 中 ,不 同 地 方 平台 的 主题 覆盖 
情况 差异 明显 ,广州 和 青岛 开放 的 数据 集 覆 盖 了 全 部 
的 14 个 主题 。 


数据 集 数 量 (个 ) 
3 061 


2310 
1521 
1 260 
1 042 1 006 o38 
701 692 664 

504 488 473 
| 中 中 195 

| 国 

让 教育 机 构 次 


毕 会 ”经 贸 向 文化 资源 卫生 公共 交通 财税 农业 城建 社保 信用 
民生 工商 科技 团体 休闲 环境 健康 安全 出 行 金融 农村 住房 就 业 服务 


主题 


je 


图 7 各 主题 包含 的 数据 集 数量 


4.4.2 部 门 覆盖 率 ”开放 数据 集 的 部 门 覆 盖 率 反映 
了 一 个 地 方 政 府 的 各 个 部 门 充分 参与 数据 开放 工作 的 
程度 和 数据 集 来 源 的 全 面 程度 。 本 研究 梳理 了 各 地 平 
台 上 开放 数据 集 较 多 的 部 门 作为 “主要 数据 提供 部 
门 ”。 图 8 反映 了 各 地 平台 上 不 同类 型 的 政府 部 门 开 
放 的 数据 集 总 量 ,其 中 统计 部 门 开放 的 数据 最 多 ,其 次 
为 教育 .交通 和 卫生 部 门 。 然 而 ,统计 部 门 提 供 的 数据 
多 为 经 过 加 工 归 总 后 的 宏观 数据 ,颗粒 度 较 大 数据 容 
量 较 低 ,不 利于 数据 被 利用 和 产生 价值 。 进 一 步 分 析 
发 现 , 在 统计 局 数据 所 占 比例 较 高 的 地 方 , 其 开放 数据 
的 容量 也 普遍 较 低 ( 见 图 9)。 

4.4.3 高 需求 关键 词 覆盖 率 ”本 研究 对 各 地 平台 上 
可 获取 、 且 下 载 量 最 高 的 前 20% 的 数据 集 名 称 进行 文 
本 分 析 ,发现 一 批 出 现 频次 较 高 的 关键 词 ,反映 了 各 地 
开放 的 高 需求 数据 集 的 内 容 及 其 分 布 。 图 10 为 其 中 


API 的 基本 信息 ,如 名 称 、 简 介 、 提 供 部 门 、 更 新 时 i 
等 ;数据 调用 说 明 指 的 是 API 的 调用 方式 \ 请 求 地 址 等 


加 


高 频 出 现 的 描述 性 限定 词 ,如 “企业 ”许可 ”“ 建 设 " 和 
“生产 ”等 。 
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二 
国 统 计 局 数据 集 比例 勾 数 据 容量 (万 ) 
图 9 各 地 数据 容量 与 来 自 统计 局 数据 的 比例 的 比较 分 析 
到 续 性 
5 品 吉文 化 医疗 交 Ha 4.4.4 数据 持续 性 
审批 AN 1 学 校 m 。 (1) 持 续 增长 。 本 研究 根据 各 地 平台 上 数据 集 的 创 
革 建 筑 道 
,行政 : N 让 教育 沁 建 日 期 来 判断 该 平台 数据 集 是 否 持 续 增 长 ,以 季度 为 时 
投资 旅游 ， 娃 设 段 进 行 跟踪 分 析 。 从 平台 上 线 开 始 , 以 季度 为 观测 时 段 
经 营 生 产 、 eh 的 全 国 各 地 平台 数据 集 持续 增长 情况 见 图 11 ,颜色 区 域 
一 工 ea 一] sy wk ee 一 、 
-hen VT Dae 表示 该 时 段 有 新 增 数据 集 ,空白 区 域 则 表示 该 时 段 无 新 
交通 旺 &s 经 济 条 增 数据 集 。 其 中 ,上 海 市 平台 从 2012 第 四 季度 发 布 数据 
本 开始 ,至今 数据 已 保持 了 15 个 时 段 的 持续 增长 。2016 年 
图 10 各 地 高 需求 开放 数据 集 名 称 中 出 现 人 > 人 
以 来 各 地 上 线 的 新 平台 也 大 都 能 保持 数据 集 定 期 增长 。 


40 


频次 最 高 的 描述 性 限定 词 
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.全 (2) 动 态 更 新 。 该 报告 跟踪 考察 了 地 方 数 据 平台 在 
2038 年 1 月 至 2018 年 4 月 期 间 更 新 的 数据 集 数量 ,情况 
区 ">。 贵阳 平台 在 该 时 段 内 更 新 的 数据 集 数 量 最 多 ， 
FE- 000 个 ,但 有 少数 地 方 平台 完全 没有 更 新 数据 。 


数量 (个 ) 


M07 要 
贵阳 ”威海 贵州 东莞 滨州 ”泰安 菏泽 青岛 上 海 济宁 淄博 


12 各 地 平台 数据 集 动态 更 新 数量 (前 10 名 ) 


(3) 历 史 存 档 。 历 史 存档 是 指 平台 将 历史 上 不 同 
时 间 更 新 的 多 个 批 次 的 数据 同时 留存 在 平台 上 供用 户 
下 载 , 有 利于 数据 利用 者 按时 间 线 索 来 获取 和 利用 历 
史 数 据 。 图 13 反映 了 数据 历史 存档 的 平台 分 布 情况 。 
目前 有 上 海 广东 ,广州 等 15 个 地 方 平台 实现 了 数据 
历史 存档 。 


11 各 地 平台 上 线 时 间 与 数据 集 持续 增长 情况 


5 研究 结论 


5.1 从 国家 层面 深入 到 地 方 层面 

目前 ,针对 政府 数据 开放 已 发 布 了 多 个 权威 性 的 
国际 评估 报告 ,其 中 影响 力 最 大 的 两 个 是 万 维 网 基金 
会 发 布 的 “开放 数据 晴雨 表 ” 和 英国 开放 知识 基金 会 
组 织 发 布 的 “全 球 开放 数据 指数 "。“ 开 放 数 据 晴雨 
表 ” 是 由 万 维 网 基金 会 开展 的 全 球 性 评估 项 目 , 于 
2013 年 启动 ,采用 专家 调查 辅助 数据 同行 评估 、 定 
量 数据 和 定性 评估 结合 的 方式 ,每 两 年 左右 从 “准备 
度 ”“ 执 行 " 和 “产生 的 影响 ”3 个 层面 对 各 国政 府 数据 
开放 进行 评估 。2016 年 ,“ 开 放 数 据 晴雨 表 ” 对 115 个 
国家 进行 了 评估 ,中 国 排 名 第 71 位 。“ 全 球 开放 数据 
指数 "是 由 开放 知识 基金 会 在 全 球 范围 内 进行 的 评 佑 
项 目 ,主要 对 各 国 开放 的 关键 数据 集 进行 评 佑 ,采用 滚 
雪 球 抽样 .志愿 者 问卷 调查 和 访谈 的 持续 性 众 包 ,专家 
评估 、 同 行 评估 等 方式 进行 。2015 年 该 指数 评估 了 
122 个 国家 和 地 区 ,中 国 排名 第 93 名 。 

从 国际 政府 数据 开放 评估 报告 的 结果 可 见 : 一 方 
面 ,我 国政 府 数据 开放 在 国际 上 仍 处 于 靠 后 的 位 置 ,有 


图 二 情报 三 作 
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上 海 广东 广州 东莞 後 庆 中 山 北京 长 沙 梅州 无 锡 武汉 湛江 阳江 济南 惠州 江西 扬州 宁夏 宁波 
浙江 贵州 贵阳 荆门 青岛 深圳 江门 山东 乌 海 淄博 淄博 枣庄 东营 烟台 潍坊 济宁 泰安 威海 日 昭 
苏州 佛山 哈尔滨 莱芜 德州 聊城 菏泽 菏泽 

加 有 历史 存档 ”号 无 有 历史 存档 


图 13 实现 数据 历史 存档 的 平台 分 布 


待 提 升 。 另 一 方面 ,国际 数据 开放 评估 报告 的 评估 体系 
和 方法 也 并 不 完全 适用 于 中 国政 府 数据 开放 的 实际 现 
状 和 发 展 阶段 。 例 如 ,针对 法 律 政策 和 体制 机 制 等 方面 
的 评估 指标 还 无 法 直接 运用 于 中 国情 景 ;针对 数据 开放 
后 产生 的 利用 效果 和 影响 的 评估 对 于 中 国 目前 的 数据 
开放 现状 而 言 还 有 些 超前 ,而 且 这 些 评估 报告 也 未 能 对 
中 国 地 方 层面 政府 数据 开放 的 现状 进行 评估 。 
@ 因 此 ,针对 过 去 国际 评估 未 能 触及 到 的 地 方 政府 


协议 中 明确 授予 了 用 户 免费 获取 、 不 受 牙 视 、 自 由 利 
用 、 自 由 传播 和 分 享 数据 的 权利 ,但 许多 地 方 的 政府 数 
据 开放 平台 仍 未 提供 明确 充分 的 数据 开放 授权 。 

在 数据 的 技术 性 开放 上 ,各 地 平台 上 可 机 读 , 非 专 
属 以 接口 形式 提供 的 数据 集 比 例 稳 步 增长 。 贵 阳 市 
在 全 国 率先 提供 了 RDF 格式 的 数据 集 。 然 而 ,全 国 各 
地 仍然 存在 很 多 不 符合 开放 数据 格式 标准 的 数据 集 。 

在 元 数据 完整 性 上 ,目前 大 多 数 地 方 平台 都 能 提 
供 基 本 的 元 数据 ,但 各 地 情况 参差 不 齐 , 普 遍 缺 少数 据 


es ee 0 


[我 条 民 面 ， i, 并 结 
> 
点 针对 数据 质量 .数据 标准 数据 可 持续 性 .数据 
数 芒 和 数据 覆盖 面 等 维度 进行 评估 。 与 国际 上 现 有 的 
译 章 体系 相 比 ,这 一 框架 更 有 助 于 真正 推动 中 国 地 方 
ee 
开展 的 地 方 评估 ,本 研究 的 评估 样本 更 为 全 面 , 覆 
ie 
更 碘 聚 焦 。 
5.@ 数据 数量 稳步 增长 ,但 数据 集 容量 偏 低 
研究 发 现 ,目前 我 国 各 地 开放 数据 集 总 量 稳步 增 


集 的 发 布 时 间 、 更 新 时 间 ,数据 指标 和 数据 量 等 条 目 
5.5 ”数据 覆盖 面 较 低 ,以 统计 数据 为 主 

在 主题 覆盖 率 上 , 目前 各 地 平台 上 提供 最 多 的 数 
据 集 主 题 是 社会 民生 和 经 贸 工 商 , 但 不 同 地 方 平台 的 
主题 覆盖 情况 不 一 。 

在 部 门 覆盖 率 上 ， ee 
部 门 是 统计 局 。 统 计 局 发 布 的 多 为 二 手 的 、 经 过 加 工 
归 总 的 数据 集 其 再 利用 价值 低 于 来 自 业务 部 站 的 一 
手 的 \ 原 始 的 数据 集 。 全 国 仍 有 接近 半数 的 地 方 政府 
各 部 门 参与 开放 数据 的 程度 不 到 一 半 。 

在 关键 词 履 盖 率 上 ,各 地 开放 的 高 需求 数据 集 名 
称 中 出 现 “ 企 业 ”“ 许 可 ”“ 建 设 ”" 和 “生产 ”的 频次 最 


长 ,其 中 贵阳 .上 海 .青岛 .武汉 等 地 的 数据 集 总 数 已 突 
破 1 000 个 ,但 仍 有 20 多 个 地 方 的 开放 数据 集 总 数 还 
不 足 200 个 。 男 外 需要 引起 重视 的 是 ,各 地 开放 的 数 
据 集 数 据 容量 整体 偏 低 ,多 数 地 方 开 放 的 数据 集 行 数 
与 列 数 过 少 , 这 类 数据 集 无 法 被 有 效 利用 。 
5.3 ”数据 质量 参差 不 齐 , 问 题 数 据 普遍 存在 

部 分 地 区 已 上 线 了 一 批 高 容量 、 高 需求 的 优质 数据 
集 , 但 大 多 数 地 方 的 数据 集 质量 参差 不 齐 , 各 地 普遍 存 
在 低 容量 碎片 化 的 低 质数 据 或 重复 创建 ,格式 生硬 转化 
和 无 效 的 问题 数据 。 这 些 低 质量 数据 和 问题 数据 很 难 
被 再 次 利用 并 产生 相应 价值 ,使 数据 开放 流 于 形式 。 
5.4 数据 标准 有 待 规范 和 提升 

在 数据 的 法 律 性 开放 上 , 少 部 分 地 方 平 台 的 授权 
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高 ,但 有 少数 城市 的 覆盖 率 不 到 三 成 。 
5.6 数据 可 持续 性 偏 低 ,日 常 更 新 和 增长 不 足 

少数 地 方 能 基本 保持 新 增 数据 集 持续 增长 与 存量 
数据 集 动态 更 新 ,但 不 少 地 方 平台 出 现 数据 集 增长 间 
鞭 或 停滞 ,真正 实现 存量 数据 动态 更 新 的 比例 仍然 俩 
低 。 此 外 , 仅 有 不 到 一 半 的 地 方 将 历史 上 多 个 批 次 的 
数据 留存 在 平台 上 供用 户 获取 。 多 数 地 方 平 台 对 开放 
数据 持续 运 维 与 持续 更 新 的 重视 程度 不 够 。 


6 ”对 策 建 议 
6.1 提升 数据 数量 


既 要 提升 开放 数据 集 的 总 体 数量 ,更 要 注重 提升 
数据 集 的 数据 容量 ,也 就 是 要 提升 开放 数据 集中 的 字 
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段 数 ( 列 数 ) 和 条 数 ( 行 数 ) 。 
6.2 提高 数据 质量 

开放 价值 密度 高 ,社会 需求 高 的 优质 数据 集 ,随意 
发 布 一 些 易于 发 布 的 、 低 密度 ,碎片 化 .有 问题 的 数据 
并 不 会 创造 价值 。 开 放 数据 应 多 从 用 户 的 实际 需求 而 
非 政府 部 门 的 自我 判断 出 发 ,定期 向 数据 利用 者 征集 
需求 和 建议 ,有 针对 性 地 开放 社会 真正 有 需求 的 .能 
决 问题 和 创造 价值 的 优质 数据 集 ,并 确保 数据 的 完整 
性 ,准确 性 和 适用 性 。 
6.3 ”规范 数据 标准 
6.3.1 ”法律 性 开放 ”为 开放 数据 提供 授权 协议 ,明确 
授予 用 户 免费 获取 ,不 受 歧视 .自由 利用 、 自 由 传播 与 
分 享 开放 数据 的 权利 ,并 进一步 探索 分 级 分 类 的 方式， 
对 钞 同 的 数据 集 配备 不 同 内 容 的 授权 协议 。 
6 技术 性 开放 ”基于 开放 数据 的 基本 原则 和 标 
准 E 开 放 完整 的 \ 原 始 的 、 可 机 读 的 开放 格式 的 、 结 
梅 化 的 \ 电 子 化 的 数据 集 ,让 用 户 能 把 数据 真正 用 起 
末 避 依据 T， Bemers-Lee 提出 的 开放 数据 五 星 标准 ， 
现 隐 自我 国 大 部 分 地 区 的 开放 政府 数据 已 符合 三 星 
枯 滑 ,下 一 步 各 地 政府 数据 开放 应 向 四 星 标准 RDF 
桥 救 迈进 ,并 继续 向 五 星 标准 发 展 ,使 数据 之 间 实现 
.二 除了 确保 数据 可 被 直接 下 载 ,政府 数据 开放 平台 
澳 和 对 数据 规模 大 .动态 实时 性 强 、 处 理 要 求 高 的 数据 
通 蛙 API 接口 方式 进行 开放 。 还 要 为 API 接口 提供 规 
范 笑 述 ,包括 资源 描述 和 数据 调用 说 明 , 帮 助 数据 利用 
者 @9 解 API 的 具体 信息 及 获取 方式 ,从 而 更 好 地 调用 
接口 并 获取 数据 。 
6.3.3 元 数据 完整 性 平台 在 开放 数据 集 的 同时 还 
应 提供 全 面 的 元 数据 信息 ,以 帮助 数据 利用 者 清楚 
地 了 解数 据 集 的 内 容 与 背景 ,从 而 更 好 地 理解 和 利 
用 数据 。 元 数据 条 目 可 包括 数据 名 称 、 摘 要 简介 , 标 
签 /关键 字 数据 主 题 数 据 格式 .开放 属性 、 提 供 单 
位 发布 日 期 .更 新 日 期 .更 新 频率 .数据 量 和 字段 名 
称 等 。 
6.4 ”扩大 数据 覆盖 面 

尽 可 能 覆盖 重点 开放 领域 的 关键 数据 集 ,提升 数 
据 的 广度 ,丰富 度 和 针对 性 ,使 数据 利用 者 可 充分 获取 
和 整合 多 种 来 源 的 数据 ,进行 深度 挖掘 和 利用 。 政 府 
需 着 力 提高 各 个 业务 部 门 参与 开放 数据 的 程度 ,而 不 
是 将 开放 数据 的 重点 部 门 都 放 在 统计 部 门 上 。 


6.5 保持 数据 可 持续 性 


开放 政府 数据 是 一 项 持续 性 和 常态 化 的 工作 , 数 
据 集 在 开放 后 还 需 持 续 更 新 和 增加 。 只 有 源源 不 断 的 
数据 供给 ,才能 激发 数据 利用 的 活力 ,满足 社会 对 开放 
数据 日 次 增长 的 需求 。 政 府 应 建立 长 效 工作 机 制 , 确 
保 开 放 数据 集 存量 动态 更 新 , 增 量 持续 不 断 , 并 将 不 同 
时 间 开 放 的 历史 数据 留存 在 平台 上 供 数据 利用 者 继续 


下 载 利用 。 
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Assessing Open Data at Local Government Level : Framework and Findings 
Zheng Lei Li Wenzeng 
School of International Relations and Public Affairs ，Fudan University, Shanghai 200433 

民 DA pstract: [ Purpose/ significance | This paper attempts to construct an assessment framework on open government 
d 和 者 jat local government level ，evaluate the data dimension on existing local government open data platforms in China and 
pcfprward suggestions to foster the opening of local government data. [ Method/process | Based on the definitions ，prin- 
c 布 民 and standards of open data, learning from international open data assessment frameworks, taking in consideration of 
thENiolicy requirement and development status of open data practices in China, this paper constructs a systematic, multi- 
dfinehsional and operable assessment framework, and carries out an actual assessment on forty -six local government open 
da platforms in China. [ Result/conclusion | The study finds out a number of problems with regard to the quantity, 
quaality, standard, coverage and sustainability of open data on local government platforms in China. 
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